以爬取斗鱼直播上的信息为例: URL地址:http://capi.douyucdn.cn/api/v1/getVerticalRoom?limit=20&offset=0 爬取字段:房间ID、房间名、图片链接、存储在本地的图片路径、昵称、在线人数、城市 1.items.py 2.spiders/do ...
分类:
移动开发 时间:
2017-07-30 18:09:11
阅读次数:
193
导火索场景: 原来:mysql中 result表 img字段原存储字符串,内容为某图片链接; 现在:该字段需要存储多张图片链接,1-3个元素行程的数组; google得到的普遍建议有两种: https://stackoverflow.com/questions/3413291/how-to-stor ...
分类:
数据库 时间:
2017-07-26 10:40:22
阅读次数:
437
网站链接: 1、文字链接 2、图片链接 建设内链的作用: 1、让蜘蛛更有效率的爬行网站,增加网站收录; 2、控制网站内部权重传递,提升关键词排名; 3、增加用户体验度; 内链建设原则: 保证每个页面都至少有一个文本链接指向; 1、网站导航(顶部、底部); 2、面包屑导航; 3、板块文章的链接; 4、 ...
分类:
Web程序 时间:
2017-07-23 11:29:52
阅读次数:
277
# -*-coding:utf-8-*— ''' 题目描述: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-) 地址: http://tieba.baidu.com/p/2166231880 思路: 用正则表达式匹配图片链接,然后进行下载 ''' ''' import re... ...
分类:
编程语言 时间:
2017-07-19 14:03:26
阅读次数:
131
一、HTML简介 1.1什么是HTML l HTML(HyperText Mark-up Language)即超文本标记语言或超文本标签语言。 l 何为超文本:“超文本”可以实现页面内可以包含图片、链接,甚至音乐、程序等。 l 网页文件本身是一种文本文件,它通过标记符号来标记要显示的网页中的各个部分 ...
分类:
Web程序 时间:
2017-07-14 23:55:12
阅读次数:
234
在爬取这个网站之前,试过爬取其他网站的漫画,但是发现有很多反爬虫的限制,有的图片后面加了动态参数,每秒都会更新,所以前一秒爬取的图片链接到一下秒就会失效了,还有的是图片地址不变,但是访问次数频繁的话会返回403,终于找到一个没有限制的漫画网站,演示一下selenium..
分类:
编程语言 时间:
2017-07-12 23:17:31
阅读次数:
979
HTML HTML 是什么? htyper text markup language 即超文本标记语言 超文本: 就是指页面内可以包含图片、链接,甚至音乐、程序等非文字元素。 标记语言: 标记(标签)构成的语言. 网页==HTML文档,由浏览器解析,用来展示的 静态网页:静态的资源,如xxx.htm ...
分类:
编程语言 时间:
2017-07-07 13:10:12
阅读次数:
177
首先讲开发网页三种技术:html,css,javascript。html负责网页的结构,css站在没学角度对网页进行美化,javascript负责网页交互,站在用户体验角度设计网页交互效果 而我们所学的html是一种超文本标记语言。何谓超文本?超文本就是指文本、图片、链接、音乐、程序等等一些可以表示 ...
分类:
Web程序 时间:
2017-06-27 11:55:37
阅读次数:
173
目录 1.什么是html html是超文本标记语言(HyperText Markup Language)。超文本表示可以链接文本 、图片、链接、音乐、程序等;标签表示html文件是各种各样的标签组成,其中包含单标签和双标签。单标签如<meta>,<hr>;双标签如<head></head>。 htm ...
分类:
Web程序 时间:
2017-06-25 17:47:52
阅读次数:
238